IT168首页 > 陶然
  • 从数据孤岛到智能系统:RAG与知识图谱协同

    本文探讨了RAG和知识图谱之间的协同作用,并提供了真实世界的示例、详细的解释和清晰的可视化图表,以展示它们的变革能力。

    陶然 · 2025-01-21 14:29
  • 百度百舸AIAK大模型推理引擎极限优化TPS

    大模型推理引擎是生成式语言模型运转的发动机,是接受客户输入 prompt 和生成返回 response 的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。

    陶然 · 2025-01-21 09:50
  • 如何快速定位并优化CPU与JVM内存性能瓶颈?

    本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路,首先通过监控告警及时发现资源使用率的异动,然后结合方法级别的 CPU/内存火焰图定位热点代码,帮忙研发同学快速排障,优化系统资源使用,确保应用在高负载下的稳定运行。

    陶然 · 2025-01-20 09:51
  • 华为计算产业:开源开放,引领数字变革新征程

    近日,在主题为“共建开放生态 共赢数智未来”2025新春媒体沙龙会上,华为分享了在计算产业生态建设方面的成绩单,华为具体交出了怎样的答卷呢?我们一一解读。

    陶然 · 2025-01-16 22:14
  • Oracle推出Exadata X11M提升AI、OLTP和分析数据库性能

    Oracle 推出了其最新的 Exadata 平台——Oracle Exadata X11M,以提升 AI、在线事务处理(OLTP)和分析数据库的性能。X11M 专为优化 Oracle 数据库(包括 Oracle 自主数据库)的性能而设计,与上一代 Exadata 系统相比,在云、多云和客户数据中心中表现出显著的速度和效率提升。

    陶然 · 2025-01-16 17:39
  • 基于数据中心部署的冷板液位计运行可靠性研究

    第四次工业革命又称智能革命,是新一轮的技术产业变革,围绕互联网、物联网、大数据、机器学习(ML)、人工智能(AI)等核心技术展开。随着这些技术的快速进步,对算力的要求不断提高,导致CPU、GPU等芯片的热设计功率(TDP)、机架功率密度、数据中心能耗和建设规模不断提升。

    陶然 · 2025-01-16 15:09
  • 金融风控领域的大模型落地实践

    智能体在金融领域的应用包括欺诈调查与数据分析助手,预示着通过大模型辅助构建类 AGI 系统的可能性,能够进一步提升金融风控的效率与效果,在金融领域拥有广泛的应用前景。本文将分享 Akulaku 在金融风控领域的大模型落地实践。

    陶然 · 2025-01-15 17:02
  • 小红书:“流量盛宴”下的IT架构挑战与机遇

    最近,社交媒体界发生了一件引人瞩目的大事:大批 “TikTok难民” 涌入小红书,使其在美国应用商店下载榜单中跃居榜首,在多个国家的下载榜单中也名列前茅。这一现象不仅让小红书一夜之间成为国际热门社交平台,也引发了人们对于小红书背后的IT架构能否应对这一流量冲击以及小红书能否抓住这一机遇实现更大发展的诸多思考。

    陶然 · 2025-01-15 14:34
  • 微软代码埋雷,Linux内核6.13险翻车,英特尔和AMD紧急救场

    今天,一则关于微软代码引发的技术事故在开源社区引起轩然大波。微软为改善x86_64/AMD64(即64位AMD和英特尔CPU)架构性能所贡献的代码,在未经x86内核维护者确认(Ack)的情况下就被推送,这一失误险些导致Linux内核6.13版本“翻车”。

    陶然 · 2025-01-14 17:52
  • 英伟达CES:未来,就在我们手中

    从英伟达联合创始人兼首席执行官黄仁勋的主题演讲来看,AI系统似乎正在顺利实现第一点。日前,英伟达在拉斯维加斯消费电子展(CES)上发布的全新的Cosmos世界基础模型,更是标志着其正朝着第二个重点奋力前进。

    陶然 · 2025-01-14 14:34
  • 京东广告生成式召回基于NVIDIA TensorRT-LLM的推理加速实践

    推荐系统的主要任务是根据用户的历史行为预测其兴趣点,并向其推荐相应的商品。传统的推荐系统在处理用户请求时,会触发多个召回模块,以召回大量候选商品。随后,系统通过相对简单的粗排模型对候选集进行初步筛选,缩小候选范围,最后通过精排和重排模型,确定最终返回给用户的推荐结果。

    陶然 · 2025-01-14 10:02
  • 架构师指南之开放表格式和对象存储篇

    近年来,开放表格式和对象存储正在重新定义各个组织构建其数据系统的方式,并为可扩展、高效、且面向未来的数据湖仓奠定了基础。通过利用对象存储的成本效益等独特优势,以及 Apache Iceberg、Delta Lake 和 Apache Hudi 等开放表格式的高级元数据管理功能,组织正在创建满足现代化数据工作负载需求的模块化架构。

    陶然 · 2025-01-13 13:47
  • 什么?!Redis也可以是成本优化利器

    本文将从概念、设计、实现和适用场景等多个维度介绍Redis Stream在交通模块的应用。

    陶然 · 2025-01-13 09:59
  • 为何企业需要AI查询引擎来推动代理式AI?

    根据 IDC 的 Global DataSphere,到 2028 年,企业每年将产成 317ZB 数据——包括 29ZB 的独特数据——其中 78% 是非结构化数据,44% 为音频和视频数据。由于数据量巨大且类型多样,大多数生成式 AI 应用只会使用所存储和生成数据总量的一小部分。

    陶然 · 2025-01-09 17:34
  • 百度视频搜索架构演进

    随着信息技术的迅猛发展,搜索引擎作为人们获取信息的主要途径,其背后的技术架构也在不断演进。本文详细阐述了近年来视频搜索排序框架的重大变革,特别是在大模型技术需求驱动下,如何从传统的多阶段级联框架逐步演变为更加高效、灵活的端到端排序框架。

    陶然 · 2025-01-09 10:20
  • OpenAI故障复盘|如何保障大规模K8s集群稳定性

    本文通过OpenAI近期遭遇的重大服务中断事件作为案例,深入分析了Kubernetes (K8s) 架构在大规模集群环境下的稳定性挑战,以及阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性的。

    陶然 · 2025-01-08 16:38
  • 抖音集团离线数仓血缘基础能力的构建与应用

    企业数据建设面临两大类问题:第一类问题:聚焦于如何有效识别数据传输链路,特别是在各公司离线数仓规模持续扩大的背景下。用户常遇到以下挑战:首先,针对多业务线场景,需要明确某一 Hive 表中包含哪些业务线的数据,以及某个业务线的数据具体存储在哪些 Hive 表中。这要求企业具备标签识别能力,以清晰界定业务范围。

    陶然 · 2025-01-08 14:24
  • 有这个异常日志问题自动追踪机制,看谁捅篓子还跑得掉

    为了高效地发现、定位和解决预发问题,闲鱼团队研发了一套异常日志问题自动追踪-定位-分发机制。这套机制通过自动化手段,实现了异常日志的定时扫描、精准定位和自动分发,显著降低了开发和测试的成本,提高了问题解决的效率。

    陶然 · 2025-01-07 14:16
  • 网页结构建模在低质采集站上的识别应用

    百度搜索拥有着几十亿级的流量,作弊团伙通过各种各样的手段妄想从巨大的流量中不劳而获。搜索反作弊团队维护百度搜索生态安全和质量,经过不断探索并利用前沿技术过滤低质作弊网页,保护真正付出劳动的站长的利益。本文介绍了基于MarkupLM的网页建模方式,引入XPath embedding自动化提取作弊页面结构特征,并与文本结合来进行采集站点识别。

    陶然 · 2025-01-07 10:08
  • 哪吒汽车官网异常,显示系统维护中,预计下周恢复,面临裁员、停工、股权冻结困境

    这一事件看似只是一次普通的技术故障,但结合哪吒汽车在2024年所遭遇的一系列困境,如工厂停摆、裁员、CEO离职以及股权冻结等,却让人不禁对这家车企的现状和未来发展产生深深的担忧。

    陶然 · 2025-01-07 09:49